Цель: подготовить исследование рынка заведений общественного питания в Москве, найти интересные особенности и презентовать полученные результаты, которые в будущем помогут в выборе подходящего места для открытия нового заведения.

Ход: 1)Изучить пропуски

2)Избавиться от дубликатов

3)Изучить категоральные и колличественные данных на наличие проблем в данных

4)Добавить 2 новых столбца

5)Изучить категории заведений

6)Проанализировать доли сетевых заведений

7)Рассмотреть какие есть сетевые заведения

8)Изучить распределение заведений по районам Москвы

9)Изучить средние рейтинги категорий заведений, а также рейтинги заведений по районам

10)Расположить уже существующие заведения на карте Москвы

11)Рассмотреть улицы на которых больше всего и менее всего заведений общественного питания

12)Более детально изучить данные, которые могут быть полезны для открытия кофейни

13)Дать рекомендацию для открытия нового заведения

14)Составить презентацию

Описание данных

name — название заведения;

address — адрес заведения;

category — категория заведения, например «кафе», «пиццерия» или «кофейня»;

hours — информация о днях и часах работы;

lat — широта географической точки, в которой находится заведение;

lng — долгота географической точки, в которой находится заведение;

rating — рейтинг заведения по оценкам пользователей в Яндекс Картах (высшая оценка — 5.0);

price — категория цен в заведении, например «средние», «ниже среднего», «выше среднего» и так далее;

avg_bill — строка, которая хранит среднюю стоимость заказа в виде диапазона, например: «Средний счёт: 1000–1500 ₽»; «Цена чашки капучино: 130–220 ₽»; «Цена бокала пива: 400–600 ₽». и так далее;

middle_avg_bill — число с оценкой среднего чека, которое указано только для значений из столбца avg_bill, начинающихся с подстроки «Средний счёт»: Если в строке указан ценовой диапазон из двух значений, в столбец войдёт медиана этих двух значений. Если в строке указано одно число — цена без диапазона, то в столбец войдёт это число. Если значения нет или оно не начинается с подстроки «Средний счёт», то в столбец ничего не войдёт.

middle_coffee_cup — число с оценкой одной чашки капучино, которое указано только для значений из столбца avg_bill, начинающихся с подстроки «Цена одной чашки капучино»: Если в строке указан ценовой диапазон из двух значений, в столбец войдёт медиана этих двух значений. Если в строке указано одно число — цена без диапазона, то в столбец войдёт это число. Если значения нет или оно не начинается с подстроки «Цена одной чашки капучино», то в столбец ничего не войдёт.

chain — число, выраженное 0 или 1, которое показывает, является ли заведение сетевым (для маленьких сетей могут встречаться ошибки): 0 — заведение не является сетевым 1 — заведение является сетевым

district — административный район, в котором находится заведение, например Центральный административный округ;

seats — количество посадочных мест;

street - название улицы, на которой находится заведение

is_24_7 - информация о работе заведения круглосуточно

Были импортированы библиотеки Python для работы с данными, вычислительных операций и визуализации анализа. Также были загруженны сами данные. И предварительно изучили данные, их типы.

В таблице представлены данные о название, категории, адресе, административном районе, часах работы, широте и долготе, рейтинге, ценах, средней цене заказа и средней сумме чека, цене за чашку капучино, является ли заведение частью сети и сколько в нем посадочных мест для каждого заведения в таблице. Всего в таблице 8406 различных заведений общественного питания.

В таблице пропуски стобцах с количесвтвенными значениями нельзя заменить 0 так как эти значения будут важны для дальнейшего анализа. Пропуски в категоральных значениях были заменены на "Не известно". Также был проведен поиск дубликатов и в результвте него, явных дубликатов найдено не было.

Был произведен анализ количественных и категоральных признаков в результе которого не было выявлено никаких явных проблем в данных.

Неявные дубликаты могут находиться в колонке name, поэтому приведем все названия к одному регистру. После этого проверяем данные на наличие дубликатов.

Был найден один неявный дубликат, после чего дубликат был удален

Также в таблицу были добавлены два столбца с информацией о название улицы из столбца адреса и информации о круглосуточной работе заведения

Изучим заведения общественного питания какой категории преобладают в Москве.

Заведений по типу кафе и ресторанов в Москве на порядок больше чем других, также насчитывается большое количество кофеен. Скорее всего это связано с популярностью таких мест, так как туда можно придти и с комфортом отдохнуть и вкусно поесть никуда не торопясь.

Для того чтобы убедиться, что для многих клиентов важен комфорт и обстановка, изучим какие категории заведений наиболее удобны, а точнее где насчитывается большее число посадоы=чных мест.

Посадочных мест больше всего в заведениях категории кафе и рестораны, это связано в первую очередь с тем что таких заведений в целом больше по Москве, но такде они расчитаны на то что посетители приходят и с комфортом могут отдохнуть в их стенах.

Посмотрим на данные о том являются ли заведния сетевыми

Не сетевых заведений в Москве на порядок больше, скорее всего это связано что многие просто открывают одно заведения и ждут пока она начнет приносить прибыль чтобы дальше расширяться, к тому же если делать сеть заведений это сложнее в плане документов.

При анализе долей сетевых заведений, стало известно что большую долю сетевых заведений от общего чиисла заведений в категориив занимают булочные и также среди пиццерии и кофейни

Теперь же давайте изучим самые популярные сети общественного питания по количеству заведений. И посмотрим на возможные взаимосвязи между ними.

Самой крупной сетья является кафе под названием "Кафе", на втором месте кофейня "Шоколадница" и третьей по популярности можно назвать сеть пиццерий "Домино'с Пицца". На первый взгляд нет очевидного общего признака, который объединял бы все эти сети. Некоторые из этих сетей распространены по всей России.

Рассмотрим какие административные округа присутствуют в нашем датасете. И заведения общепита находящиеся в них.

Наибольшее количество разных заведений можно наблюдать в центральном районе. В нем число заведений общественного питания, намного превышает их количество в других районах Москвы.

Теперь же перейдем к основным критериям по которым клиенты выбирают заведение куда сходить.

Средние рейтинги абсолютно всех категорий завекдений варируются от 4 до 4,5. В общем лучший средний рейтинг находится около 4,4, а самый низкий 4,05

Средние рейтинги заведений по районам не сильно отличаются друг от друга. Самые высокие оценки можно увидеть у заведений в Цетнральном админимтративном округе около 4,38. Ну а хуже всего отзываются о заведениях в Юго-Восточном административном округе, там их оценка около 4,1.

С помощью кластеров на карте Москвы были отмечены все заведения общественного питания из датасета

Больше всего заведений распологается на улице под названием "Проспект Мира", здесь их количество намного превышает, количество заведений на других улицах

Явных признаков по которым можно сказать что эти заведения похожи нет, но о многих из них отсутсвует большое количество информации.

Самые большие значения средних чеков можно отметить в Центральном и Западном административных округах, они равны, также можно отметить что значения чеков больше в округах которые находятся рядом сразу и с Центральным и с Западным, это: Северо-Западный и Северный административные округа.

Теперь нужно изучить данные о кофейнях в Москве, так как заказчик хочет открыт ьновую доступную кофейню.

Для начала найдем все кофейни в датасете всего их 1413. Далее будем использовать эту таблицу так как в ней мы оставили заведения только из категории кофейни.

Явное большинство кофеен на распологаются в Центральном административном округе. Можно обратить внимание что по данным датасета их 428.

Также из интереса были изучены улицы на которых находятся наибольшее количество кофеен. С помощью кластеров они отобразились на карте. Можно отметить что больше всего кофеен распологаются на большим улицах, таких как: проспект Мира, Ленинградский и Ленинский проспекты

Помимо улиц с наибольшим числом кофеен на них, были найдены улицы на которых находятся по одной кофейне. Они также отображены на карте с помощью кластеров. По большей части это наоборот небольшие улочки, которые находятся недалеко от домов.

Кофейни которые работают круглосуточно в датасете не найдены

Разница в рейтингах кофеен огромна от 1,4 до 5. При этом можно отметить что кофейни с низким рейтингом не так много, так как медианное значение равно 4,3.

Также были изучены рейтинги всех заведений этой категории, как сетевые, так и не сетевые.

Если же говорить о среднем рейтинге кофеен по административным округам. Но средний рейтинг по районам не сильно отличается самый низкий в Западном административном округе, а самые высокие рейтинги в Центральном и Северо-Западном

Разброс цен на одну чашку капучино варируется от 60 до 1568 рублей, если же брать медианное значение, так как у многих кофеен отсутвуют эти данные, оно равно 170 рублям.

Средняя цена за чашку капучино не сильно различается. Оптимальным вариантом цены за чашку кофе будет 150-170 рублей, но также важно что нужно отталкиваться от того, где будет распологаться кофейня.

Я бы посоветовал открыть кофейню в Западном административном округе, так как в нем в целом большое количество заведений общественного питания, в том числе и кофеен. Но важно заметить что при условии того что число кофеен достаточно большое их средний рейтинг является самым низким, что говорит нам о том что им необходимо хорошее заведение. Также важно отметить что средняя цена одной чашки капучино равна 189 рублям, что тоже очень значительно даже для Москвы, это 3 по величине средняя стоимость. Такая высокая средняя цена позволяет в самом начале взять за основу больший диапозон цен. Также в качестве расположения я бы посоветовал расматривать относительно небольшие улицы, на которых находятся максимум 1-2 кофейни, а сами улицы распологаются рядом с жилыми домами чтобы они были в пешей достурности для посетителей кофейни. Наример: улица Горбунова, Партизанская улица или Ельнинская улица. Также классным дополнением для кофейни будет условие что она будет круглосуточно, так как таких кофеен еще нет в Москве

https://disk.yandex.ru/client/disk/Яндекс%20Практикум